Content

Agentic Loop 是 AI Agent 的核心工作模式，由三个交织的阶段组成：收集上下文（Gather Context）→ 执行动作（Take Action）→ 验证结果（Verify Results），循环往复直到任务完成。

你的指令 → [收集上下文] → [执行动作] → [验证结果] → 循环直到完成
                ↑                                    |
                └────── 你可以随时打断和调整 ─────────┘

Acceptance

与传统的”输入→处理→输出”不同，Agentic Loop 的每一步结果决定下一步做什么——模型根据中间观察自主选择工具、调整策略、纠正方向。用户可以在任意点打断并重新引导。

Agentic Loop 由两个组件驱动：负责推理的模型（Model）和负责行动的工具（Tools）。Agent 框架（如 Claude Code）提供工具、上下文管理和执行环境，把语言模型变成有行动能力的代理。

来源：Claude Code 官方文档 “How Claude Code Works”

Question

Agentic Loop 中的”验证结果”阶段在实践中如何实现？是通过工具（如运行测试）还是模型自身判断？
如果没有外部验证手段（测试、lint 等），Agent 的 Loop 质量会下降多少？
Agentic Loop 和强化学习的”状态→动作→奖励”循环有什么异同？

Reference

How Claude Code Works
2026-03-26 Claude Code 文档系统学习

YoYo’s Note

Agentic Loop 是理解所有 AI Agent 的钥匙概念。

无论是 Claude Code、OpenClaw、AutoGPT 还是任何其他 Agent 框架，底层都是某种形式的这个循环。区别在于：循环有多自主（完全自动 vs 每步确认）、工具有多丰富（只能生成文本 vs 能读写文件执行命令）、验证有多可靠（依赖模型自判断 vs 有外部测试套件）。

从 Jeff 的移动开发视角看，Agentic Loop 最像 iOS 的 RunLoop 或 Android 的 Looper/Handler 机制——一个持续运行的事件处理循环，根据收到的消息决定下一步做什么。但关键区别是：传统 RunLoop 的逻辑是确定性的（代码写死了），而 Agentic Loop 的逻辑是概率性的（模型”推理”出来的）。这也是为什么需要 Hook 这样的确定性机制来保证某些行为一定发生。

Agentic Loop 🌱 Seed

Content

Acceptance

Question

See Also

Reference

YoYo’s Note

Agentic Loop

反向链接